查看原文
其他

【星际随笔之55】神狗胜天半子,侥幸还是吊打?快评AlphaGo首局胜柯洁

作者:袁煜明/蒋佳霖/徐聪/雷雳/陈冠呈/洪依真

写这篇时就一个想法,不能跪着写。

 

举世瞩目的AlphaGo与柯洁首局比赛结束,符合所有人预期,AlphaGo取得了胜利,虽然只赢了1/4子。

 

这篇随笔内容包括:

1. 神狗赢1/4子是否侥幸?

2. 先捞后洗是否是柯洁的有效策略?

3. 这次的AlphaGo相比之前有何不同?

1. 神狗赢1/4子是否侥幸

1/4子是围棋上的最小胜负。虽然电视剧里总有些绝世高手,每次输给皇帝1/4子,但实际高手对决时,1/4子的胜负都会被冠以险胜/惜败的字眼。

这次比赛采用的是中国规则,如果用日韩规则,其实还是柯洁赢半目(两个规则在贴目上有一目的差距)。

 

然而并没有人觉得AlphaGo是险胜,只是情商高。

因为到中盘之后,其实AlphaGo已经领先了不少,后面柯洁收官时虽然追得很猛,但狗显然是一切尽在掌握,有张有弛,只求赢,不求多赢。

从之前的Master的很多局比赛来看也是如此,除非是中盘胜负,不然下到终局都赢得不多。因为按照编程逻辑,只是在力求获胜概率最大,而不是赢的目数最多。

 

当然,这局棋柯洁不是没有机会。

虽然开局柯洁黑7点三三我觉得是略亏的,但后面在左上战斗中感觉柯洁下得不错,尤其白48拆二我觉得有点缓,被柯洁打入下边后,局面很不错。(网上有说前50手柯洁就已经崩盘了,我觉得是言过其实了)。

但之后柯洁的黑55太过激进,只活了左下一个小角比较吃亏。再后面就是黑97也是太激进,虽然当时评棋的都叫好,但从结果来看是冒进失败,被白棋成功打入逃出。如果这些着法都没下错,胜负还难说。

 

另外,柯洁比较吃亏的地方在于用时和体力。

这个比赛每方三小时,但和通常世界大赛不同在于没有午休。对AlphaGo来说当然无所谓,对人来说就比较吃力了。从12点后传回来的图片看,柯洁明显停顿、小动作增多,最后从用时上也是柯洁用得多很多。从结果来看,柯洁前半盘要比后半盘下得好。

午休对棋手影响的确是很大的。举个例子,2011年古力在三星杯决赛爆冷败给元晟溱,他妈妈就分析因为没有午休,输棋是因为饿了。

2. 先捞后洗是否是柯洁的有效策略?

先解释一下先捞后洗。

围棋有两个概念,实地和厚势。大致实地相当于价值股,利润当期兑现,厚势相当于成长股,短期啥也没有,空间很大。

棋界一直以来有两个流派,实地好还是厚势好。其中实地派中有种极致的打法就是先捞后洗。就是我自己先捞够实地,然后打入你厚势想要围起来的空间,将其破坏掉。

 

从之前棋局来看,AlphaGo也是更喜欢实地而不是厚势。因为从胜率的角度,无疑厚势的不确定性更大。从之前另外几个AI绝艺和Deepzen的情况来看,厚势围空然后杀掉打入的棋子也是相对的弱项。

 

于是,柯洁准备把对手引到对方不喜欢的地方,自己先捞后洗。

一上来柯洁第3手就三三,第7手再点三三。如果当年学棋时哪个小朋友敢这么下,肯定被批评没认真学。但柯洁显然是精心准备了这个打法,在此前他已经在多个正式比赛中点三三来练兵。虽然从结果来看黑7局部并不成功,但毕竟达到了把对手逼到围厚势的目的。

 

但AlphaGo显然是明白了柯洁的意图,从白26到46,一系列腾挪之后,把柯洁的角给掏了。虽然局部来看也不算成功,但同样地,把柯洁逼去围厚势了。最后柯洁的败着黑97,也是因为强行围厚势,才被AlphaGo打入做活而落败的。

 

敌之要点即我之要点。显然先捞后洗是双方共同的策略。

只是柯洁贯彻得不如AlphaGo彻底(当然也是功力不如狗更深),最后被迫强行杀棋落败。接下来几盘如果柯洁贯彻这一策略,并非没有机会。

 

当然,从棋局进程看,柯洁显然是精心准备了与狗的对局(不像去年李世石基本没准备),第一局亮出的是三三流的先捞后洗,不排除后面两局还有别的策略。

3. 这次的AlphaGo相比之前有何不同?

之前有很多猜测。比如是否会采用不学习人类棋谱的版本?是否这版水平会高很多?是否会用单机版?等等。

我们先说结论,还是学习了人类棋谱,水平没有比之前的高,是单机版。

 

昨天我们在随笔里分析了如果是没有学习过人类棋谱的AlphaGo会怎么样,会下出怎么样出人意料的着法来。但从结果来看,下得实在是太正常了(除了白24难以理解),甚至可以说下得比柯洁更像人类在下棋(柯洁的三三特别像狗下的)。如果不学习人类棋谱肯定没法如此规矩。

 

另一个猜测是AlphaGo是否比上一版本进步很多,彻底碾压人类,但从结果来看也没有。不像和李世石的比赛,好几场都是一边倒的局面。主要原因应该是用了单机版。

 

赛后发布会上,DeepMind创始人哈萨比斯发言表示,这次的版本是单独机器,比和李世石下的版本的计算资源的1/10。

所以,虽然从结果上看并没有特别强,但从技术上是个巨大的突破。类似人们把计算机从大型机做到PC后,就可以走入千家万户了。

计算资源在一年里可以节约掉90%,这个速度比摩尔定律还快。如果可以持续的实现摩尔定律,那么以后AI的应用领域会增加很多。

 

当然,现在由于还没有详细披露技术细节,无法得知是怎么省下这90%的,也无法得知是否可以持续摩尔定律。

Deepmind团队已经向Nature投稿了,论文里会有更多细节。明天的人工智能论坛可能也会介绍一些。我们明天会到现场去学习,欢迎关注。

往期精华链接

【星际随笔之九】曲率已驱动了头发——深度分析谷歌AlphaGo击败职业棋手

【星际随笔之12】快评谷歌围棋与李世石大战的规则披露

【星际随笔之16】一个低级失误提前了载入史册的日子——写在谷歌围棋首局战胜李世石之后

【星际随笔之17】信心被完全摧毁 我很同情,以及尊敬李世石——写在李世石输掉和AlphaGo的第二局后

【星际随笔之18】假如围棋界有黄健翔——写在李世石首次战胜AlphaGo后

【星际随笔43】再度回归的Master会带来什么新思考

【星际随笔之54】写在乌镇决战的前夜


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存